Content
研究发现(“Imperative Interference” 论文):在英文中,多个指令块形成协作网络——移除任何一块都会降低遵从率。但在某些语言中(如西班牙语),相同的指令块变为竞争关系——移除部分块反而提升性能 81%。
Acceptance
- 研究发现(“Imperative Interference” 论文):在英文中,多个指令块形成协作网络——移除任何一块都会降低遵从率。但在某些语言中(如西班牙语),相同的指令块变为竞争关系——移除部分块反而提升性能 81%。
- Claude Haiku 对指令变化的敏感度最高(0.117 range,vs DeepSeek 的 0.042),意味着冗余或冲突的约束对 Haiku 伤害最大。
- “Control Illusion” 论文指出:即使最先进的模型也缺乏维持正确指令优先级的鲁棒机制,在系统级和用户级指令冲突时经常失败。
- 重复指令或概念”without adding new information”会限制模型创造力并造成干扰。
Question
- 如何检测约束系统中的隐性冗余(两条规则表述不同但语义重叠)?
- 英文中指令块的”协作网络”效应,是否意味着在英文 skill 中冗余的危害比中文 skill 小?
See Also
Reference
- 来源:2026-03-28 Claude Code 对话(spec-skill reform 任务中的弱模型调研)
- 论文:Imperative Interference: Social Register Shapes Instruction Topology in Large Language Models (arxiv 2603.25015)
- 论文:Control Illusion: The Failure of Instruction Hierarchies in Large Language Models (arxiv 2502.15851)
YoYo’s Note
- 这个发现改变了 skill 系统的约束分层设计。原来认为”多说几遍更安全”,实际上冗余约束不仅浪费 token,还会降低遵从率。新原则:
<rule>铁律、Red Flags 表格、加粗规则三个层级必须提供不同信息,不能重复同一条规则。 - Haiku 最敏感这个发现很关键——我们的 task skill 用 Haiku 做后台通知任务(Linear sync),如果给 Haiku 注入冗余约束,效果反而变差。